Pipelines für effiziente und robuste Ad-hoc-Textanalyse
نویسنده
چکیده
Suchmaschinen und Big-Data-Analytics-Anwendungen zielen darauf ab, ad-hoc relevante Informationen zu Anfragen zu finden. Häufig müssen dafür große Mengen natürlichsprachiger Texte verarbeitet werden. Um nicht nur potentiell relevante Texte, sondern direkt relevante Informationen zu ermitteln, werden Texte zunehmend tiefer analysiert. Dafür können theoretisch komplexe Pipelines mit zahlreichen Analysealgorithmen eingesetzt werden. Aufgrund fehlender Effizienz und Robustheit sind die durchgeführten Textanalysen in der Praxis jedoch bislang auf einfache, manuell erstellte Pipelines für antizipierte Anfragen beschränkt. Der vorliegende Beitrag gibt einen Überblick über einen Ansatz zur automatischen Erstellung von Pipelines für beliebige Textanalysen. Die resultierenden Pipelines sind effizienzoptimiert und arbeiten robust auf heterogenen Texten. Der Ansatz kombiniert zu diesem Zweck neuartige Verfahren, die auf Techniken der klassischen künstlichen Intelligenz und des maschinellen Lernens basieren. Formale Untersuchungen wie auch zahlreiche empirische Experimente belegen, dass der Ansatz einen wichtigen Schritt hin zum Ad-hoc-Einsatz von Textanalyse-Pipelines in Suchmaschinen und Big-Data-Analytics-Anwendungen darstellt.
منابع مشابه
IP-Autokonfiguration in mobilen Ad-hoc-Netzwerken
Die Unabhängigkeit mobiler Ad-hoc-Netzwerke (MANETs) von einer Kommunikationsinfrastruktur eröffnet zahlreiche neue Möglichkeiten der mobilen Kommunikation. Auf Grund der speziellen Randbedingungen in diesen Netzen, wie die Notwendigkeit zur Selbstorganisation, die hochdynamische Topologie und die beschränkte Bandbreite und Energie, entstehen jedoch auch neue Anforderungen an Systemkonzepte und...
متن کاملInternet integration of vehicular ad hoc networks
Selbstorganisierende Ad-hoc-Netze gelten als Schlüsseltechnologie für zukünftige telematikgestützte Fahrzeugdienste. Die Bereitstellung von Internet-Diensten im Fahrzeug erfordert die Integration dieser Netze in das Internet, für die es keine gängigen Protokolle gibt. In dieser Arbeit wird mit MOCCA ein neuartiger Ansatz für die Internet-Integration von Fahrzeugnetzen vorgestellt. MOCCA verfolg...
متن کاملEffiziente Endsystem-basierte Multicast-Dienste in Mobilen Ad-hoc-Netzwerken
Zusammenfassung: Die Kombination von mobilen Ad-hoc-Netzwerken und Endsystem-basierten Protokollen bieten interessante Ansätze zur Erbringung vollständig dezentraler und infrastrukturloser Dienste. Dies trifft auch auf den universitären Bereich zu, in welchem die Bereitstellung campusweiter Gruppendienste zur Unterstützung von Studierenden von großem Nutzen sein kann. Für den erfolgreichen Betr...
متن کاملEine Protokollumgebung für Peer-to-Peer Dokumentenaustausch in infrastrukturlosen mobilen Umgebungen
Dieses Paper stellt zwei neuartige Konzepte für einer Protokollumgebung für den Peer-to-Peer Dokumentenaustausch in infrastrukturlosen Systemen von mobilen Endgeräten vor: Passiv verteiltes Indexieren (PDI) und Asynchrone Dokumentenübertragungen (ADT). PDI ermöglicht den Aufbau eines selbstorganisierenden Index von populären Inhalten ohne explizite Übertragung von Indexeinträgen. ADT gewährleis...
متن کاملKursrelevanzprognose von Ad-hoc-Meldungen: Text Mining wider die Informationsüberlastung im Mobile Banking
Zusammenfassung: Internet-basierte Börseninformationsdienste erfreuen sich großer Beliebtheit bei privaten und institutionellen Anlegern. Die sprichwörtliche Flut täglich verfügbarer Unternehmensnachrichten erschwert jedoch eine effiziente Weiterleitung von tatsächlich kapitalmarktrelevanten Informationen insbesondere auf portable, technisch meist eingeschränkt ausgestattete Endgeräte im Rahmen...
متن کامل